آنالیز مولفه مستقل و استفاده از آن برای بهبود بازشناسی گفتار فارسی
پایان نامه
چکیده
در این پروژه، استفاده از آنالیز مولفه مستقل خطی (lica) با توجه به قدرت آن در مدل کردن اطلاعات آماری مرتبه بالای گفتار مورد بررسی قرار گرفته است. ما از این روش برای تطبیق هرچه بیشتر بخش استخراج ویژگی با داده مورد پردازش استفاده کردیم.در بخشی از کار از آن برای تخمین فیلتربانک مبتنی بر داده استفاده کردیم و نشان دادیم که فیلتربانک بدست آمده از این روش قادر است ویژگیهایی را استخراج کند که مقاومت بیشتری دربرابر نویز دارند. ما آزمایشات خود را در این قسمت روی پایگاه داده اعداد متصل aurora2 و پایگاه داده گفتار پیوسته فارسی farsdat با دایره لغات متوسط انجام دادیم. نتایج روی پایگاه داده 2 aurora به ازای پارامترهای مختلف بدست آمد. بهترین نتیجه، نشان دهنده کاهش 9 درصدی خطای بازشناسی نسبت به سیستم پایه بوده است. با اینهمه، نتایج بازشناسی اولیه روی farsdat کاهش شدیدی نسبت به حالت پایه نشان داد که ناشی از نحوه انتخاب بردارهای پایه غالب در آن بود. ما برای بهبود نتایج، یک روش محلی برای انتخاب توابع پایه غالب ica ارائه کردیم که موجب کاهش 17 درصدی خطای بازشناسی نسبت به حالت پایه و درشرایط تست نویزی شد.در بخشی دیگری از پروژه با استفاده از آنالیز مولفه مستقل، یک فیلتر زمانی طیف طراحی شده که در طولهای کمتر نتایج بهتری را نسبت به سایر روشهای آماری می دهد و از اینرو می تواند حائز اهمیت واقع شود. نوآوری ما در این قسمت، تلفیق دو روش آنالیز مولفه اساسی (pca) و ica به دو صورت متفاوت می باشد که منجر به بهبود نتایج بازشناسی شده است.در ادامه به بهسازی گفتار با استفاده از یک روش مبتنی بر ica پرداخته شده است. روش بکاررفته در بهسازی، انقباض کدگذاری پراکنده (scs) نام دارد که عملکرد آن به پارامتری به نام سطح آستانه نرم بستگی دارد و در سیگنال به نویزهای پایین افت می کند. ما از یک تبدیل بهینه خطی برای کاهش سطح آستانه و متعاقب آن بهبود عملکرد scs در سیگنال به نویزهای پایین استفاده کردیم. علاوه بر این، روش بهسازی ارائه شده در نویزهای مختلف دارای راندمان قابل قبولی است.همچنین در این پروژه، ما روش pca-fx را که یک نوع روش آنالیز مولفه اساسی با سرپرستی است، برای بهینه کردن شکل فیلترهای مل بکاربردیم که البته بهبودی چندانی نسبت به pca نداشته است.درادامه کار می توان از مدلهای پیچیده تر، ica غیرخطی و مدل کانوالوی، که انطباق واقعیتری با پدیده های طبیعی دارند، استفاده کرد.
منابع مشابه
رتبهبندی واجهای گفتار فارسی از نظر کارآیی در بازشناسی گوینده
در این مقاله، کارآیی واجهای گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآییها، رتبهبندی واجها صورت گرفتهاند. جهت برآورد کارآیی واجها، از یک معیاری که بهصورت نسب « فاصلة بینگویندهای» واجها به « فاصلة در گویندهای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیدهایم، استفاده شده است. آزمایشها و محاسبات لازم برای کلیه واجهای گفتار...
متن کاملپایهگذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی
Although researches in the field of Persian speech recognition claim a thirty-year-old history in Iran which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...
متن کاملبهبود روش های آشکارسازی مولفه ی p300 با استفاده از الگوریتم آنالیز مولفه های مستقل
فعالیت های شناختی بخشی از فعالیت های مغزی هستند که در طی آن می توان حالات مختلف مغز را شناسایی و آشکارسازی نمود. یکی از روش های بسیار متداول در ثبت سیگنال های مغزی، ثبت پیوسته ی پتانسیل های مغزی یا eeg نام دارد. یکی از انواع سیگنال های مغزی، پتانسیل های وابسته به رخداد نام دارند. این سیگنال ها در شرایطی اعمال تحریک به فرد یا وقوع یک رخداد در سیگنال های مغزی ظاهر می شوند. با توجه به ارتباط تنگان...
15 صفحه اولبازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی
حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود. برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تأثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی...
متن کاملبازشناسی احساس از روی گفتار پیوسته فارسی
در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...
اعمال روشهای بهبود گفتار به عنوان پیش پردازش جهت بالا بردن دقت بازشناسی گفتار فارسی
کارایی سیستمهای بازشناسی در حضور نویز کاهش می یابد. در این پایان نامه روشهای مقاوم کردن سیستم بازشناسی در برابر نویز دسته بندی شده و از بین آنها روشهای مبتنی بر داه بررسی می شود. روشهای مختلف تفاضل طیف ، جبران کپسترال، نگاشت ضرایب و روشهای مبتنی بر ویژگیهای مقاوم تحلیل شده اند. یک رابطه جدید برای تسطیح نویز در تفاضل طیف و یک لیفتر جبران کننده برای وزندهی ضرایب کپسترال پیشنهاد شده است . همچنین ا...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023